
# 丢弃率, 防止过拟合
MODEL_DROPOUT_PROB_DEFAULT = 0.1
# nn.LayerNorm 默认的 eps 参数值
LAYER_NORM_EPS_DEFAULT = 1e-6
# masked_fill 默认的 value 参数值
MASKED_FILL_VALUE_DEFAULT = -1e9

# 多头注意力的数量
HEAD_NUM_DEFAULT = 8
# 编码器/解码器层数
LAYER_NUM_DEFAULT = 6
# 词向量的维度
EMBEDDING_SIZE_DEFAULT = 512
# 前馈全连接层的隐藏层维度
HIDDEN_SIZE_DEFAULT = 2048

# 最小序列长度
MIN_SEQUENCE_LENGTH_DEFAULT = 1
# 最大序列长度
MAX_SEQUENCE_LENGTH_DEFAULT = 512

# 最小预测源序列长度
MIN_PREDICT_SOURCE_SEQUENCE_LENGTH_DEFAULT = 1
# 最大预测源序列长度
MAX_PREDICT_SOURCE_SEQUENCE_LENGTH_DEFAULT = 512
# 最大预测结果序列长度
MAX_PREDICT_RESULT_SEQUENCE_LENGTH_DEFAULT = 128
